利用 Jobs 來建立資料處理與分析的工作流程,這也是資料工程的基礎但是非常有用的技能,來看看 Databricks 上面怎麼操作吧。
概念上來說,就是:
dbt 算是目前主流的資料流工具之一,透過 Databricks Job 也可以整合 dbt core 來進行資料處理。相關文件
相關的程式碼也可以透過版本控制系統來管理,例如 Git,這樣就可以透過 Databricks Job 來執行這些程式碼。相關文件
Airflow 算是老牌的資料工程工具,透過 Databricks Job 也可以整合 Airflow 來進行資料處理。相關文件
Reference: